Intuisi Model linear teritlak

Regresi linear biasa meramalkan nilai jangkaan untuk kuantiti yang tidak diketahui (pemboleh ubah bergerak balas, pemboleh ubah rawak) sebagai gabungan linear bagi satu set nilai yang diperhatikan (peramal). Ini menunjukkan bahawa perubahan yang berterusan dalam peramal membawa kepada perubahan yang berterusan dalam pemboleh ubah bergerak balas tersebut (iaitu model tindak balas linear). Ini sesuai apabila pemboleh ubah bergerak balas boleh berbeza-beza, kepada anggaran yang baik, selama-lamanya dalam mana-mana arah, atau lebih umum untuk sebarang kuantiti yang hanya berbeza dengan jumlah yang agak kecil berbanding dengan variasi dalam pemboleh ubah ramalan, cth. ketinggian manusia.

Walau bagaimanapun, andaian ini tidak sesuai untuk beberapa jenis pemboleh ubah bergerak balas. Sebagai contoh, dalam kes di mana pemboleh ubah bergerak balas dijangka sentiasa positif dan berbeza-beza dalam julat yang luas, perubahan input berterusan membawa kepada perubahan keluaran secara geometri (iaitu eksponen), dan bukannya berubah secara berterusan. Sebagai contoh, katakan model ramalan linear belajar daripada beberapa data (mungkin terutamanya diambil dari pantai yang besar) bahawa penurunan suhu 10 darjah akan menyebabkan 1,000 lebih sedikit orang melawat pantai. Model ini tidak mungkin digeneralisasikan dengan baik ke atas saiz pantai yang berbeza. Lebih khusus lagi, masalahnya ialah jika anda menggunakan model tersebut untuk meramalkan kehadiran baharu dengan penurunan suhu 10 untuk pantai yang kerap menerima 50 pengunjung pantai, anda akan meramalkan nilai kehadiran yang mustahil iaitu sebanyak -950. Secara logiknya, model yang lebih realistik sebaliknya akan meramalkan "kadar" yang berterusan bagi peningkatan kehadiran pantai (cth. peningkatan dalam 10 darjah membawa kepada dua kali ganda dalam kehadiran pantai, dan penurunan dalam 10 darjah membawa kepada separuh kehadiran). Model sedemikian disebut sebagai model tindak balas eksponen (atau model log-linear, kerana logaritma respons tersebut diramalkan berubah secara linear).

Begitu juga, model yang meramalkan kebarangkalian untuk membuat pilihan ya/tidak (pemboleh ubah Bernoulli) adalah kurang sesuai sebagai model tindak balas linear, kerana kebarangkalian dihadkan pada kedua-dua hujung (ia mestilah antara 0 dan 1). Bayangkan, sebagai contoh, model yang meramalkan kemungkinan orang tertentu pergi ke pantai sebagai fungsi suhu. Model yang munasabah mungkin meramalkan, sebagai contoh, bahawa perubahan dalam 10 darjah menjadikan seseorang dua kali lebih atau kurang berkemungkinan pergi ke pantai. Tetapi apakah maksud "dua kali lebih mungkin" dari segi kebarangkalian? Ia tidak boleh bermakna menggandakan nilai kebarangkalian (cth. 50% menjadi 100%, 75% menjadi 150%, dsb.). Sebaliknya, ia ialah kemungkinan yang digandakan: daripada kemungkinan 2:1, kepada kemungkinan 4:1, kepada kemungkinan 8:1, dsb. Model sedemikian ialah log-kemungkinan atau model logistik.

Model linear teritlak merangkumi semua situasi ini dengan membenarkan pemboleh ubah bergerak balas yang mempunyai taburan arbitrari (bukan sekadar taburan normal), dan untuk fungsi arbitrari untuk pemboleh ubah bergerak balas tersebut (fungsi pautan) untuk berubah secara linear dengan peramalnya (daripada menganggap bahawa tindak balas itu sendiri mesti berbeza secara linear). Sebagai contoh, kes ramalan bilangan pengunjung pantai di atas biasanya akan dimodelkan dengan taburan Poisson dan pautan log, manakala kes ramalan kebarangkalian kehadiran pantai biasanya akan dimodelkan dengan taburan Bernoulli (atau taburan binomial, bergantung pada bagaimana masalah itu diungkapkan) dan fungsi pautan log-kemungkinan (atau logit).